1. Descripción de las muestras:

6 muestras de células mononucleares (CD45+) de lámina propia de intestino delgado de ratón.

Se analizaron dos cepas de ratón:

  • Wildtype (WT) (n = 3)

  • IgA knockout (IgA-KO) (n = 3)

2. Metodologia

2.1. Previa

Análisis single-cell RNA-seq:

  • Procesamiento de datos: Cell ranger v.6.1

  • Genoma de referencia: refdata-gex-mm10-2020-A

Análisis de los datos: paquete de R Seurat.

  • Controles de calidad y filtrado: nº de células, distribución de features y counts, % genes mitocondriales, expresión del gen Malat1.

  • Reducción de dimensiones mediante PCA.

  • Normalización por SCTransform.

  • Pruebas de integración de las muestras mediante tres métodos (Harmony, CCA, RPCA).

2.2. Actual

Se seleccionó la integración mediante Harmony para realizar el clustering.

Se repitió la reducción de dimensiones PCA eliminando la cadena ligera de las immunoglobulinas (eran muy abundantes y podíanenmascarar los datos para hacer el clustering). Las cadenas pesadas no se eliminaron porque podrían resultar informativas en nuestro caso, para localizar clusters de diferentes isotipos en el caso de las células B.

Se realizaron pruebas de clustering mediante UMAP a diferentes resoluciones y se creó un árbol de clusters para facilitar la elección.

Una vez seleccionada la resolución final, se realizó una predicción de las principales poblaciones generales con el paquete SingleR y la base de datos de ratones ImmGenData, además de estudiar el listado de marcadores propios de cada cluster.

Luego, cada cluster o supercluster (conjunto de clusters que aparecen agrupados) se sometió por separado a un nuevo clustering, siguiendo la misma metodología, para localizar las subpoblaciones celulares.

3. Clusters celulares

3.1. Selección de resolución

Resolución 0.1

Resolución 0.3

Resolución 0.5

Resolución 0.7

Resolución 0.9

Resolución 1.1

Resolución 1.3

Resolución 1.5

Resolución definitiva

La resolución final escogida fue de 0.3.

3.2. Etiquetado de los clusters principales

a) Clasificación SingleR (ImmGenData)

b) UMAP de los clusters etiquetados

3.3. Subclusters

a) T cells, ILC, NK

a.1) UMAP inicial

a.2) Marcadores

a.3) Clasificación SingleR (ImmGenData)

a.4) UMAP definitivo

b) Myeloid cells

b.1) UMAP inicial

b.2) Marcadores

b.3) Clasificación SingleR (ImmGenData)

b.4) UMAP definitivo

c) B cells

c.1) UMAP inicial

c.2) Marcadores

c.3) UMAP: expresión de cadenas pesadas de inmunoglobulinas

c.4) Clasificación SingleR (ImmGenData)

c.4.1) Huella genética de PC y GC

c.5) UMAP definitivo

4. Etiquetas finales

4.1. Versión con epithelial cells y células ambiguas

Superclusters

Subclusters

4.2. Versión final sin células contaminantes

Superclusters

Subclusters

5. Comprobaciones: marcadores específicos